Adv-TGD: Ataque generativo adversarial basado en texto para reconocimiento facial
Descubre Adv-TGD, el nuevo ataque adversarial que engaña sistemas de reconocimiento facial con 85.9% de éxito y alta calidad visual.
Descubre Adv-TGD, el nuevo ataque adversarial que engaña sistemas de reconocimiento facial con 85.9% de éxito y alta calidad visual.
Mejora la transferibilidad adversarial en modelos VLP con DeBias-Attack, que corrige el sesgo del modelo sustituto para ataques más efectivos.
Generación de instancias adversariales y entrenamiento robusto para optimización combinatoria multiobjetivo. Mejora el rendimiento en distribuciones complejas.
SlotGCG explota vulnerabilidades posicionales en prompts para jailbreak. Logra un 14% más de éxito que GCG, con solo 200ms de preprocesamiento. Descubre cómo.
Descubre cómo un ataque de envenenamiento sigiloso en vectores de dirección puede burlar la seguridad de LLMs. Aprende sobre la defensa ortogonalización.
Descubre cómo TRAP usa parches adversariales para secuestrar razonamiento CoT en robots VLA y provocar comportamientos peligrosos. Vulnerabilidad crítica en IA.
Descubre cómo la sensibilidad de clasificadores es un arma de doble filo, y cómo HPM equilibra discriminabilidad y robustez adversarial. ¡Lee más!
¿Sabías que los modelos de IA multimodales son más vulnerables a ataques con video que con imágenes? Un estudio revela cómo el video multi-clip aumenta el éxito de los jailbreaks.
Descubre un framework A* multiagente que ofusca prompts de LLM, induciendo alucinaciones de sentido común con alta eficacia y pocos intentos.
Descubre cómo ataques adversariales mediante algoritmos genéticos pueden engañar a agentes de IA en ingeniería inversa, ocultando código malicioso en binarios.